苍狼白鹿,星霜几度|万字长文回顾 2022 年数据库行业
快速冷却的市场
年度技术 - Velox
Type - 通用类型系统。
Vector - 基于兼容 Apache Arrow 列式内存的向量化能力。
Expression Eval - 表达式运算,也包括利用前面提到的向量能力。
Function - 函数框架。
Operators - 算子,比如 SQL 数据库里的 TableScan(全表扫描),Project (映射),Filter(过滤),Aggregation(聚合),Order (排序),Join(连接)。
IO - 和 IO 系统对接。
Resource Management - 计算资源管理。
年度功能 - ReadySet
年度数据库 - Neon
其他数据库盘点
Google AlloyDB
原生 (vanilla) OLTP MySQL, PostgreSQL, SQL Server - Cloud SQL。
云原生数仓 OLAP - BigQuery。
云原生分布式 OLTP 数据库 - Cloud Spanner。
Snowflake Unistore
渠道(Distribution)。
本身的产品力和整套平台。
AP 切 TP 更匹配大客户画像,愿意给 100 分 AP + 60 分 TP 买单的公司比 60 分 AP + 100 分 TP 的公司要多不少。
公司总是先有 TP 系统,之后业务规模上去后再引入 AP 系统。一开始很难去说服研发团队 / DBA 用一个数仓出身的数据库来接管在线业务,何况 Snowflake 又卖的那么贵。
如果后续想再换 TP 系统也很难,TP 是 AP 的上游,通常都是上游强势。而且 TP 是在线系统,AP 是离线系统(排除极少量反向 ETL),换 TP 相当于给飞行中的飞机换引擎。而想推动 TP 更换 Unistore 的一定是大数据团队,但单纯站在 TP 团队的角度,缺少能够打动他们更换成 Unistore 的价值点。
TP 数据库团队不掰应 Unistore 这样 AP 出生的混血系统(就像 AP 团队不掰应 TP 出生的混血系统)。
AP 团队利用 Unistore 拓展 TP 场景,和 TP 团队开始打架,重复建设。
SQLite
SQLite + WASM,SQLite in your Browser (2022)
SQLite + WASM + LiteFS,Globally Distributed SQLite in your Browser(2023)
SQLite + WASM + LiteFS + DuckDB ,Globally Distributed HTAP in your Browser(2023/2024)
PostgreSQL
PostgreSQL = MySQL + 穷人版 (ClickHouse + MongoDB + Elasticsearch + InfluxDB) + Geospatial + Multi-tenancy
数据库趋势
应用开发者
工具
融合
AI 智能化
如何基于云底座实现扎实的 serverless 形态,存算分离,spot instance,tiered storage,给云上的多租户提供高性价比的数据库服务。
如何把 TP,AP 甚至数据湖结合在一起。
如何让数据库变更的开发工作流更接近代码变更的工作流。
22 年的预测打分
PlanetScale 会有很好的发展,Vercel + PlanetScale 的 VP 组合会给开发 workflow 带来一个新的 paradigm shift,尤其吸引到很多的前端和全栈开发者。
会有新的数据库问世,主打点也会是开发 workflow。
会出现做 ClickHouse 工具的初创公司,并获得不菲融资。
Firebolt 会成为史上融资速度最快的数据库公司
PostgreSQL 会拿下 2022 DB-Engine of the year
会诞生基于 SQLite 的杀手级解决方案。
开源数据库应用开发场景,会出现一款重量级工具产品。
23 年的预测
OpenAI 的技术会接入微软的 SQL Server 以及 Power BI,不管接入程度是多少,至少产品宣传上会重点强调。
Snowflake 会推出自己的 BI 产品,也可能进行 BI 方向的收购。
Snowflake Unistore 更进一步,把数据湖 (Data Lake)也纳入进来。从 Hybrid Table 到 Hyper Table?希望 TimescaleDB 不要介意吧 🙃
去年在展望 SQLite 发展的时候,一念之差,没有点名 Cloudflare。今年就直接点名一下 fly.io,正式推出 Globally Distributed SQLite in your Browser 的产品。
DB-Engine 的年度前三,1)Snowflake 2)PostgreSQL 3)SQLite。看去年 Snowflake 的领先优势,今年的第一也没有什么悬念,所以就猜前三吧。
会有新的数据库问世,主打点是处理 AI/ML 场景,会采用 PostgreSQL 协议。
开源数据库应用开发场景,会出现一款重量级工具产品 (再接再厉吧 Bytebase,也只有指望你了 💪)。
最后的总结
The appendix that explains Noria in simpler terms would never have existed were it not for my mom’s endless desire to understand what I was working on combined with her lack of interest in listening to long-winded technical descriptions.
千帆竞速,各领江湖 | 万字长文回顾 2021 年数据库行业 【5000 字长文】从 S3 到 DataZone,AWS 用 16 年讲完一个数据的故事 从 Google 删库,到蚂蚁跑路,Care 与 Fear 点燃的 Flare MotherDuck,从 SQLite 走向数据届的 Docker Bytebase - 重新定义 DBA